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摘要 : 天 台 鹅 耳 枯 为 中 国 特 有 的 濒危 植物 ， 仅 间断 分 布 于 浙江 省 境内 ， 种 群 数量 稀少 ， 已 
处 于 极 危 状态 。 该 文通 过 对 6 个 自然 居 群 (包含 所 有 居 群 的 母 株 〉 cpDNA AERE ANE 
(SNP) 研究 ， 探 讨 天 台 鹅 耳 杨 谱系 结构 与 系统 分 化 ， 以 评估 濒危 状况 ， 并 提出 相应 的 保 
护 策略 。 使 用 TIANGEN 试剂 盒 法 提取 基因 组 DNA, H Ilumina novaseq 6000 进行 高 通 量 


测序 ， 对 获得 叶绿体 全 基因 组 序列 ， 使 用 在 线程 序 OGDRAW 制作 叶绿体 基因 组 图 谱 ， 用 
DnaSP 分 析 核 苷 酸 多 样 性 ， 用 PopART 软件 进行 单 倍 型 网 络 构建 ， 使 用 RAxML 软件 构建 
ML tree， 用 MrBayes 构建 Bayes tree。 结 果 表 明 : (1) 通过 天 台 鹅 耳 枯 叶绿体 全 基因 组 序 
列 分 析 ， 大 多 数 蛋 白质 编码 基因 和 氨基 酸 序列 显示 出 明显 的 密码 子 偏 好 ， 检 测 到 cp LTR 1E 
向 重复 为 32 个 ， 回 文 重复 为 25 个 ， 反 转 重复 为 22 个 ; SSR 重复 序列 不 同类 型 为 87 ^, 
其 中 大 多 数 富 含 A /T， 单 核 华 酸 的 数量 最 多 。(2) 在 叶绿体 基因 组 中 鉴定 了 314 4 RECTE 
酸 多 态 性 ， 单 核 蔡 酸 取代 显示 天 台 鹅 耳 林 群体 属 单 系 ， 分 为 天 台 县 居 群 (THS) 和 景 宁县 
EHE (JST)， 居 群 单 倍 型 之 间 演 化 关系 呈现 星 状 中 心 辐 射 。(3) 所 有 居 群 核 昔 酸 多 样 性 的 
变异 均 较 低 CPi<0.005), JST 居 群 和 THS 居 群 单 倍 型 多 样 性 较 低 〔4 为 0.5 一 0.6)， 显 示 
出 天 台 鹅 耳 术 在 历史 上 机 到 瓶颈 后 曾 发 生 局 部 扩张 ， 居 群 间 呈现 较 大 的 遗传 分 化 ， 居 群 内 
具有 较 低 的 遗传 变异 与 居 群 间 较 高 的 分 化 水 平 。 通 过 对 叶绿体 基因 组 SNP. 的 研究 ， 揭 示 天 
台 鹅 耳 杞 的 遗传 多 样 性 和 谱系 分 化 ， 为 濒危 植物 天 台 鹅 耳 枯 种 质 资 源 保护 和 遗传 拯救 提供 
理论 依据 。 

关键 词 ， 天 台 鹅 耳 杨 ， 叶 绿 体 全 基因 组 ， 单 核 苷 酸 多 态 性 ， 谱 系 结构 ， 系 统 发 育 
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Abstract: Carpinus tientaiensis is an endangered plant species with sparse population densities 
and is endemic to China. The distribution of this species is restricted to the territory of Zhejiang 
Province and its survival rate is very low. Based on data of chloroplast (cp) single nucleotide 
polymorphism (SNP) in six natural populations (including the mother plants of all populations), 
genealogical structure and systematic development, we assessed how endangered C. tientaiensis is 
and put forward relevant conservation strategies. The genomic DNA of C. ftientaiensis was 
extracted using TIANGEN kit method and a library was constructed for high-throughput 
sequencing with Illumina novaseq 6000. To obtain the complete sequence of chloroplast genome, 
chloroplast genome maps were constructed using the online program OGDRAW. Nucleotide 
diversity was analyzed by DnaSP software while PopART was used for haploid network 
construction and RAxML was adopted for ML tree construction. Finally, MrBayes software was 
used for construction of Bayes tree. The data showed that: (1) According to whole-genome 
sequence analysis of C. tientaiensis, most of the protein-coding genes and amino acid sequences 
showed obvious codon preference. Moreover, long-term relationship (LTR) revealed 32 forward 
repeats, 25 palindrome repeats and 22 reverse repeats. We detected 87 Simple Sequence Repeats 
(SSR) in different types, most of which were A/T rich and the number of single nucleotides was 
the largest. (2) A total of 314 SNPs was identified in the cpDNA of C. tientaiensis. Single- 
nucleotide substitution indicated that C. tientaiensis was monophyletic and could be categorized 
into Tiantai county (THS) and Jingning county (JST) populations. The evolution of the haplotypes 
of the population manifested stellar radiation. (3) The variation of nucleotide diversity was low in 
all populations ( P; « 0.005) and the haplotype diversity of THS and JST populations was also low 
(Ha 0.5-0.6). This indicated that C. tientaiensis had undergone historically local expansions after 
experiencing bottlenecks across its evolution history, with lower genetic variation within 
populations and higher level of diversity among populations. The results of SNP of the chloroplast 
genome revealed the genetic diversity and lineage differentiation of C. tientaiensis, and provided 
theoretical basis for conservation of the genetic resources as well as rescue of this endangered 
plant species. 
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ASH (Carpinus tientaiensis) 属于 桦木 科 (Betulaceae) HAE (Carpinus), 
Ayr EURPECRUBS TI Z8 — 20 3L, HR REKREA ARE, 1993). 
3i Es] A f EL Js TEL I f npe, WA 33 种 、8 变种 〈 傅 立国 ，2003)， 其 中 东南 沿海 是 
BEDEA- NEZHI, REREH CC. tientaiensis) PF PERS H- CC. 
putoensis) SEJgHTLHRDCRER Rim, 1994). F AEAEE HURR E EEM FINAR 
部 《中 国 科学 院 中 国 植物 志 编 辑 委员 会 ，1979)， 浙 江 植 物 志 统计 天 台 鹅 耳 术 仅 存 5 株 〈 章 
绍 尧 等 ，1993 )， 但 近年 来 在 禹 安县 和 景 宁 县 等 地 有 所 发 现 ， 仅 间断 分 布 于 浙江 省 境内 的 天 
台 县 、 盘 安县 、 青 田 县 和 景 宁 会 族 自 治 县 ， 野 外 成 年 植株 不 足 50 株 ， 幼 年 个 体 缺少 ， 低 于 
时 外 种 群 稳定 存活 界限 ， 己 处 于 极 危 状态 。 生 境 片 断 化 使 得 野生 居 群 变 小 及 居 群 间 的 隔离 
程度 增加 ， 这 将 会 导致 遗传 变异 丧失 和 近 交 衰退 ， 最 终 增 加 物种 灭绝 的 风险 (Aguilar et al., 
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2008; Wei et al.，2012)。 根 据 IUCN 物种 红色 名 录 ， 天 台 鹅 耳 术 属于 极 危 (CR) 等 级 。 
天 台 鹅 耳 枯 染色体 为 14 倍 体 (2n=14x=112)， 是 桦木 科 倍 性 最 高 的 多 倍 体 植 物 〔 陈 模 肥 等 ， 
2020)。 天 台 鹅 耳 杞 在 研究 桦 木 科 分 类 、 上 古 植 物 区 系 、 涉 危机 制 等 研究 中 具有 很 高 的 科研 价 
值 〈 章 绍 尧 等 ，1993， 王 昌 腾 等 , 2007)。 
目前 仅 对 天 台 鹅 耳 枯 组织 解 剖 结 构 、 光 合 特性 对 生长 光 强 的 响应 、 群 落 特征 等 方面 进 
TIRAR KRAE, 2013, 20200 。 但 天 台 鹅 耳 杞 种 群 的 进化 机 制 与 种 内 系统 发 育 尚未 
明确 ， 必 须 收集 群体 样本 进行 基因 组 学 的 分 析 ， 在 基因 组 水 平 上 加 深 对 这 一 濒危 物种 居 群 
动态 的 了 解 。 叶 绿 体 基 因 组 由 于 其 高 基因 含量 和 保守 的 基因 组 结构 ， 可 用 于 研究 开花 植物 
的 母系 遗传 ， 特 别 是 多 倍 体 植 物 (Birky, 1995; Soltis et al., 2000) 。 叶 绿 体 基因 组 通常 包 
含 单亲 遗传 的 DNA， 由 于 其 自我 复制 机 制 和 相对 独立 的 进化 ， 来 自 叶 绿 体 的 遗传 信息 经 常 
被 用 来 探索 近 缘 种 间 和 种 内 的 亲缘 关系 〈 于 涛 等 ，2019) 。 目 前 叶绿体 全 基因 组 高 通 量 测 
= 序 技术 为 系统 进化 分 析 提 供 了 大 量 的 信息 位 点 ， 比 较 基因 组 结构 、 基 因 的 变异 和 重复 序列 
排列 ， 有 利于 构建 居 群 遗传 结构 、 居 群 历史 动态 和 谱系 间 分 化 〈 孙 逸 ，2012; 王 佳 慧 ， 
2015) 。 本 研究 通过 对 天 台 鹅 耳 枯 叶绿体 基因 组 高 通 量 测序 ， 通 过 对 单 核 苷 酸 多 态 性 
(SNP) 研究 ， 分 析 多 态 位 点 和 核 苷 酸 变 异 ， 评 估 居 群 的 遗传 多 样 性 水 平 ， 推 断 天 台 悉 耳 
楚 的 谱系 结构 和 分 化 ， 为 天 台 鹅 耳 术 种 质 资源 的 保护 与 恢复 制定 策略 。 
1 材料 与 方法 
1.1 天 台 狼 耳 杞 样 地 调查 及 测试 材料 
天 台 鹅 耳 枯 自然 居 群 最 高 海拔 相近 ， 均 在 890 m 以 上 ， 同 属 亚热带 山地 湿润 气候 ， 土 
HE pH 值 为 酸性 ， 森 林 植 被 覆盖 率 较 高 ， 植 被 类 型 为 亚热带 常 绿 阔 叶 林 【《 陈 模 尹 等 ，2020 )。 
天 台 故 耳 板 分 布 范围 狭窄 ， 仅 浙江 省 的 天 台 县 华 顶 山 、 敬 安县 的 大 盘山 、 高 姥山 和 青 明 尖 ， 
一 青田 县 仰天 湖 和 景 宁 会 族 自治 县 上 山头 存在 野生 群落 。 其 中 天 台 县 华 顶 山 共 存 19 株 ， 青 田 
oO 县 仰天 湖 仅 存 1 株 ， 景 宁县 大 际 乡 上 山头 胸径 20 cm 以 上 18 Ek, ERRAN KRKE LRE 
3 株 ， 高 姥山 和 青 明 尖 各 为 1 株 。 禹 安县 每 个 居 群 之 间 相 隔 20 km 之 内 ， 天 台 县 居 群 与 景 
宁县 居 群 直线 距离 约 250 km CX 1). 
表 1 天 台 鹅 耳 杨 分 布地 的 基本 概况 


Table 1 Basic conditions of each spot of Carpinus tientaiensis 


采集 编号 。 。 样本 量 分 布地 区 经 续 度 ARO 样本 编号 
x 
Collecting Sample size Distribution region Latitude and longitude Altitude Sample ID 
number (m) 
XT E E 3 
JST 10 Shangshantou, 119?37'E , 27?46'N 1 520 JST 1—10 
Jingning County 
BRZAKA 
PDS 3 Dapan Mountain, 120°31'E, 28°58'N 1130 PDS_1 一 3 


Pan an County 


BEER EI 
PGS 1 Gaomu Mountain, 120?32' E 28°54' N 1 140 PGS_1 
Pan’an County 


BRRFIR 


PQJ 1 Qingmingjian, 120°28'E, 28°49' N 1 200 PQJ_1 
Pan’an County 
青田 县 仰天 湖 

QYH 1 Yangtianhu, 119559' E, 28?12'N 1 246 QYH | 


Qingtian County 
天 台 县 华 顶 山 
THS 10 Huading Mountain， 121?05' E, 29?15'N THS 1-10 
EO 1 000 
Tiantai County 


A635 HATH EERSE B 6 个 自然 居 群 26 个 植株 《包含 所 有 居 群 的 母 株 ) C 1)。 其 中 
景 宁县 上 山头 样 地 50 m x15 年 每 隔 5 一 6 m RÆ 1 株 ， 共 9 株 平均 胸径 25.2 cm; SUPE 1 株 ， 
分 枝 最 大 胸径 11.1 cm。 兢 安县 大 盘山 、 高 姥山 、 青 明 尖 全 部 采集 共 5 株 ， 平 均 胸径 20.41 
cm。 青 田 县 仰天 湖 采 集 1 株 ， 胸 径 28.66 cm。 天 台 县 华 顶 山西 茅 棚 采集 7 株 平 均 胸 径 
43.08 cm， 公 路 附近 3 株 平均 胸径 20.07 cm。 野 外 采集 新 鲜 叶 子 后 将 其 冷冻 在 干冰 中 ， 清 
洁 叶 片 ， 并 保存 在 -80 °C 的 冰箱 中 以 备 后 续 实 验 研究 。 
1.2 叶绿体 基因 组 测序 、 组 装 与 注释 

叶绿体 基因 组 DNA 提取 使 用 TIANGEN 的 DNAsecure 新 型 植物 基因 组 DNA 提取 试剂 
盒 (DP320)， 然 后 在 Illumina novaseq 6000 平台 ， 以 150 bp 的 对 端 读 数 高 通 量 测序 ， 每 个 
样本 至 少 6 Gb 的 原始 序列 数据 。 在 过 滤 原始 数据 并 消除 数据 质量 的 影响 CPhred. 分 数 
Cutoff-300 之 后 ， 我 们 获得 了 高 质量 的 数据 。 对 获得 26 个 天 台 儿 耳 杞 叶绿体 全 基因 组 序列 ， 
利用 已 发 表 的 叶绿体 基因 组 序列 〈 登 录 号 : KY174338) 作为 参考 序列 CYang et al., 2017), 
采用 DOGMA 软件 注释 完整 的 叶绿体 基因 组 CWyman et al.,2004)， 使 用 在 线程 序 
OGDRAW (https;//chlorobox.mpimp-golm.mpg.de/OGDraw.html ) 制作 叶绿体 基因 组 图 谱 ， 
同时 对 每 条 序列 的 cp 基因 组 基本 信息 进行 统计 ， 包 括 基因 组 大 小 、 基 因 特 征 和 GC 含量 。 
1.3 重复 序列 、IR 区 域 与 边界 的 扩张 收缩 和 密码 子 偏好 性 分 析 
重复 序列 中 散在 重复 使 用 Reputer 软件 分 析 ， 用 cpLTR 表示 ;简单 重复 序列 (SSR) 
鉴定 使 用 MISA (http:/pgrc.ipk-gatersleben.de/misa/) 工具 CE: 1-10 2-5 3-4 4-3 5-3 6-3) 
分 析 。 比 较 不 同 序列 LSC、SSC 和 IR 长 度 及 边界 ， 使 用 在 线 工 具 IRscope 
Chttps://irscope.shinyapps.io/irapp/) 完成 IR. 区 域 与 边界 的 扩张 收缩 的 分 析 。 通 过 R 软件 分 
析 密 码 子 偏好 并 作 图 。 
1.4 系统 发 育 树 分 析 

为 了 检查 物种 不 同 区 域 的 系统 发 育 ， 根 据 完整 的 cp DNA 序列 进行 系统 发 育 分 析 ， 使 

] RAxML8.0 软件 进行 极 大 似 然 树 (ML tree) 构建 ， 结 合 MrBayes 3.3 软件 进行 贝 叶 斯 推 
类 法 构建 Bayes tree。 基 于 叶绿体 基因 组 开发 单 倍 型 ， 运 用 PopART 软件 构建 单 倍 型 网 络 
(Kimura, 1980; Leigh et al., 2015)。 使 用 DnaSP v6 (http://www.ub.edu/dnasp/) 软件 分 析 
核 苷 酸 多 样 性 参数 ， 通 过 AMOVA 分 子 方差 分 析 ， 评 估 谱 系 间 的 分 子 变异 程度 和 遗传 分 化 


指数 F.， 分 析 得 到 谱系 间 的 分 化 程度 。 
2 结果 与 分 析 
2.1 天 人 台 笋 耳 杨 叶绿体 的 基本 特征 

Illumina novaseq 6000 测序 平台 ， 以 150 bp 的 对 端 读数 ， 每 个 样本 平均 产生 3 000 万 对 
配对 读 取 ， 从 26 个 天 台 鹅 耳 枯 生成 的 数据 中 确定 每 个 完整 的 cp 基因 组 。 天 台 鹅 耳 杨 完整 
叶绿体 基因 组 由 四 部 分 组 成 ， 与 鹅 耳 枯 属 CCarpinus) 其 他 植物 相似 〈 杨 霄 月 ，2019;， 赵 
颂 楠 等 ，2021)。 长 度 为 159 281—159 841 bp， 平 均 为 159 616.2 bp， 每 个 叶绿体 基因 组 由 
一 个 大 的 单 拷贝 区 域 (LSC) (88 360~88 711 bp， 平 均 为 88 522.35 bp) 和 一 个 小 的 单 拷贝 
区 域 CSSC) (18 420—18 794 bp， 平 均 为 18 634.92 bp) 组 成 ， 并 由 一 对 反 向 重复 序列 隔 开 

〈 每 个 IR 26 067 一 26 451 bp， 平 均 为 26 229.46 bp) 组 成 〈 表 2， 图 1)。 
表 2 天 台 鹅 耳 杞 叶绿体 基因 组 特征 


Table 2 Characteristics of complete chloroplast genomes of Carpinus tientaiensis 


基因 组 特征 Genome characteristic 数量 Amount 

其 因 组 大 小 Genome size (bp) 159 616.2 
大 单 拷贝 区 长 度 LSC length (bp) 88 522.35 
小 单 拷贝 区 长 度 SSC length (bp) 18 634.92 
反 向 重复 序列 长 度 IR length (bp) 52 458.92 

和 蛋白质 编码 基因 数量 Protein-coding genes number 86 
tRNA 基因 数量 tRNA genes number 37 
rRNA 基因 数量 rRNA genes number 8 

车 因数 Genes number 131 

GC 含量 GC content (96) 36.41 


经 过 数据 过 滤 后 ，Q20 质量 评分 (96.46% ~97.21%) 平均 96.9896, Q30 质量 评分 
(90.81% ~92.46%) 平均 91.94%。 基 于 叶绿体 的 统计 ， 总 体 GC 含量 平均 为 36.41%, 
LSC, SSC, IR 对 应 值 分 别 为 34.20%、30.09%、42.37%，IR 区 域 的 GC 含量 高 于 LSC, 
SSC 区 域 。 叶 绿 体 基因 组 的 131 个 基因 中 ， 包 含 86 个 蛋白 编码 基因 、37 个 tRNA 基因 和 8 
个 rRNA 基因 。 其 中 : LSC 区 域 包含 60 个 蛋白 质 编码 和 22 个 tRNA 基因 ; SSC KREAS 
12 个 蛋白 质 编 码 和 1 个 tRNA 基因 ; IR 区 域 有 7 个 蛋白 质 编 码 ，7 个 tRNA 和 所 有 4 个 
RNA 基因 重复 〈 表 2， 图 1 )。 
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transcribed clockwise and those inside are transcribed counterclockwise. Dashed area in the inner circle indicates 


the GC content of the chloroplast genome. 
图 1 天 台 鹅 耳 杞 叶绿体 基因 图 谱 
Fig. 1 Gene map of Carpinus tientaiensis chloroplast genome 
2.3 叶绿体 基因 组 的 重复 序列 分 析 
滑动 链 的 不 匹配 和 重复 序列 的 不 适当 重组 可 能 导致 序列 变异 和 DNA ÆHF (Wicke et al., 

2011)。 重 复 序列 是 重要 的 遗传 标记 ， 和 物种 的 起 源 进化 息息相关 。 重 复 序列 一 般 可 分 为 散 
在 重复 和 简单 序列 重复 。 

散在 重复 使 用 Reputer 软件 分 析 ， 这 里 我 们 用 cpLTR 长 末端 重复 序列 表示 。 在 天 台 鹅 
HEH cp 基因 组 中 检测 到 正 向 重复 平均 32 个 ， 回 文 重复 25 个 ， 反 转 重 复 22 个 (图 2)， 这 
些 重复 中 的 大 多 数 表现 出 10 到 38 bp 之 间 的 长 度 。 简 单 序列 重复 (SSR) 广泛 分 布 于 叶 绿 
体 基因 组 中 ， 包 含 长 度 为 1~6 bp 重复 序列 的 短 串联 重复 ， 叶 绿 体 基因 组 中 的 这 种 短 串 联 
ER (SSR) 是 从 单亲 遗传 过 来 的 ，SSR 在 基因 组 重组 和 重 排 中 发 挥 重要 作用 ， 在 群体 遗 
传 和 进化 研究 中 ， 常 被 用 作 有 效 的 分 子 标记 (Zhou et al., 2018)。 基 于 SSR 位 于 叶绿体 区 段 
类 型 的 数量 统计 ， 天 台 鹅 耳 析 蛋白 编码 基因 平均 为 48 个 基因 、tRNA 为 3 个 基因 、 非 编码 
区 为 41 个 基因 。 其 中 蛋白 编码 基因 中 6 个 基因 GnatK« atpA« rpoB, atpB, cemA, rpl2) 
具有 1 个 串联 重复 ，1 个 基因 rpoC2 具有 4 个 串联 重复 ; 1 个 ycfl 基因 具有 2 个 串联 重复 。 
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HERKES, RA 10 个 rps12 串联 重复 基因 。 


在 cp 基因 组 中 有 87 个 不 同 的 SSR 类 型 重复 了 10 次 以 上 ， 其 中 单 核 苷 酸 的 数量 最 多 ， 
平均 有 50 个 ， 占 总 数 的 57.4790; 其 次 是 四 核 苷 酸 为 14 个 ， 二 核 音 酸 为 12 个 ， 三 核 音 酸 、 
复合 核 背 酸 各 为 4 个 ， 五 核 音 酸 发 现 的 比较 少 为 3 个 ， 而 六 核 昔 酸 没有 发 现 〈 图 3)。 在 cp 
基因 组 中 发 现 的 SSR 通常 由 A/T 重 复 组 成 ， 很 少 包含 G / C 串联 重复 序列 ， 其 中 单 核 音 
酸 由 A /T 碱 基 组 成 占 92%， 这 些 SSR 丰富 了 cp 基因 组 的 AT. cp SSR 碱 基 重 复 序列 中 10 
条 占 31.20%, 11 条 占 16.95%、12 条 占 34.44%、13 条 占 5.6596. 14 条 以 上 占 11.76% (图 


4). cp SSR 分 区 IRA、IRB 各 占 6.5896, 


LSC 68.59%, SSC 占 17.96%， 其 中 LSC 重复 


序列 最 多 CE 50. GE GHISE-I cp DNA 中 ， 观 察 到 SSR 具有 丰富 的 碱 基 重 复 和 重复 条 数 ， 


可 以 作为 居 群 进化 研究 有 用 的 遗传 信息 。 
70 
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图 2 天台 鹅 耳 枯 cp LTR 的 类 型 数量 


Fig. 2 Number of cp LTR types detected in chloroplast genomes of Carpinus tientaiensis 
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Mono-, Di-, Tri-, Tetra-, Penta-, Hexa- 表 示 1 一 6 EZ tT SSR, Complex 为 复合 核 音 酸 SSR。 
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Mono-, Di-, Tri-, Tetra-, Penta-, Hexa- indicate 1 to 6 nucleotide SSR, Complex indicates nucleotide complex 


SSR. 


3 REREH cp SSR 的 类 型 数量 


Fig. 3 Number of cp SSR types detected in chloroplast genomes of Carpinus tientaiensis 
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Fig. 4 Frequencies of identified of Carpinus tientaiensis 
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Fig. 5 Frequencies of identified SSR in LSC, IR and SSC regions of Carpinus 


tientaiensis 
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2.4 密码 子 偏好 性 分 析 

密码 子 在 遗传 信息 的 传递 中 起 着 重要 作用 ， 是 核酸 和 看 白质 之 间 的 联系 。 通 过 对 所 有 
蛋白 质 编码 的 叶绿体 DNA 和 和 氨基酸 序列 进行 统计 分 析 ， 天 台 鹅 耳 杨 叶绿体 基因 组 序列 的 
65.65% 是 蛋白 编码 基因 ， 结 果 显示 蛋白质 密码 子 的 相似 性 ， 其 中 AUG, UUA, AGA, 
GCU, UCU 的 频率 较 高 ， 而 CUG、GUG、AGC、CUC、CUG 的 频率 较 低 (图 6)。 在 这 
些 密 码 子 中 ， 蛋 白质 编码 基因 中 最 常见 的 氨基 酸 是 le EAR), HEHE DNA 中 出 
IL 1 146 次 。 相 对 同 义 密码 子 使 用 (RSCU) 值 分 析 表 明 ，Trp( 色 和 氨 酸 和 蛋白质 编码 基因 
RSCU = 1， 表 示 该 密码 子 没有 偏好 性 ;其 中 47.62% 密 码 子 的 RSCU> 1， 大 多 数 (28/30, 
93.3326) 以 A IT (U) 结尾 ，50.79% 密 码 子 的 RSCU «1, IC (30/32, 93.7596) 以 
C 或 G 结 尾 〈 图 6)。 

在 天 台 鹅 耳 杨 物种 的 蛋白 质 编码 叶绿体 基因 中 ，20 个 氨基 酸 由 63 个 密码 子 编码 ， 其 
中 除 Asp RAAR) 外 ， 大 多 数 氨基 酸 都 具有 密码 子 偏 好 性 。 总 共 确 定 了 40 个 密码 子 偏 
好 ， 其 中 涉及 19 个 氨基 酸 。 在 优选 的 密码 子 中 ，63.49% 表 现 出 较 高 的 偏好 〈 图 7)。 该 结 
果 进 一 步 揭 示 了 天 台 鹅 耳 枯 叶绿体 基因 组 的 相对 保守 性 ， 因 为 高 密码 子 偏 好 也 是 高 等 植物 
中 的 常见 现象 〈 喻 凤 等 ，2021)。 
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图 6 天 人 台 鹅 耳 枯 相对 密码 子 使 用 ORSCUO. 值 聚 类 热 图 


Fig.6 Heat map of the relative synonymous codon usage (RSCU) value of Carpinus 


tientaiensis 
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相对 同 义 密码 子 使 用 RSCU 


Ala. AAR; 
Gly. FAR; His. HAR; le. FEAR; Leu. ZAR: Lys. MAR; Met. PRAR:; Phe. NAR; 
Pro. HAR; Ser. 丝氨酸 ， Thr. HAR: Trp. C 2x02; Tyr. KAR; Val. MAR. 


Ala. Alanine; Arg. Argnine; Asn. Asparagine, Asp. Aspartate; Cys. Cysteine; Gln. Glutamine; Glu. Glutamate; 
Gly. Glycine; His. Histidine; Ile. Isoleucine; Leu. Leucine; Lys. Lysine; Met. Methionine; Phe. Phenylalanine; 
Pro. Proline; Ser. Serine; Thr. Threonine; Trp. Tryptophan; Tyr. Tyrosine; Val. Valine. 


图 7 天台 鹅 耳 术 蛋白质 编 码 基因 中 20 个 氨基 酸 密码 子 含量 

Fig. 7 Codon content of 20 amino acid in all protein-coding genes of Carpinus tientaiensis 
2.5 叶绿体 基因 组 变异 检测 
单 核 苷 酸 多 态 性 (SNP) 和 基因 组 结构 变异 在 进化 过 程 中 至 关 重 要 CBritten et al., 
2003)。 叶 绿 体 基因 组 结构 性 变异 有 插入 / 删除 、 转 换 、 匡 换 和 基因 组 结构 重 排 。 在 26 个 
天 台 鹅 耳 术 cp DNA 中 鉴定 了 314 个 单 核 音 酸 多 态 性 (SNP), SNP 的 数量 JST 居 群 平均 为 
132 条 、QYH 为 126 条 、PDS 为 18 条 、PGS 为 18 条 、PQJ 为 8 条 、THS 为 12 条。 以 居 群 
植株 与 THS _1 叶绿体 基因 组 比 对 ， 结 果 表 明 碱 基 蔡 换 数 (Tv) JST 居 群 平均 为 95 ^. 
QYH 为 900 个 PDS 为 16 个 PGS 为 15 个 、 PQJ 为 6 个 THS 为 12 个 ( 表 3)。 研 究 的 所 
有 成 对 序列 比较 表明 ， 颠 换 次 数 多 于 转换 次 数 ， 这 在 其 他 分 类 群 中 也 被 发 现 〈Stoltzfus et 
al., 2016). 


D 


d 3 KG EAE RARE ATTE 


Table 3 Chloroplast comparative genome statistical table of Carpinus tientaiensis 


FERESE 插入 和 缺失 


l 转换 颠 换 插入 缺失 
居 群 Single nucleotide Insertion and 
Transition Transversion Insertion Deletion 
Population polymorphism deletion 
(Ts) (Tv) (NS) (DEL) 
(SNPs) (INDEL) 


JST 132 90 37 95 47 43 
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QYH 126 99 36 90 39 60 
PDS 18 20 3 16 5 15 
PGS 18 18 3 15 4 14 
PQJ 8 11 2 6 1 10 
THS 12 17 0 12 5 12 

合计 Total 314 255 81 234 101 154 

2.6 IR 区 域 与 边界 的 扩张 收缩 


被 子 植物 的 cp 基因 组 是 高 度 保守 的 ，IR 区 域 和 单 拷贝 (SC) 边界 区 域 的 扩展 和 收缩 
是 造成 高 等 植物 cp 基因 组 长 度 变 化 的 主要 机 制 (Saina et al., 2018)。 比 较 26 个 完整 的 天 台 
REH cp 基因 组 的 IR / SC 边界 区 域 ， 发 现在 连接 位 置 上 有 明显 差异 。 其 中 rp 基因 的 长 
度 都 是 1 513 bp， 其 端点 较 保 守 ， 离 JLA, JLB 基因 间隔 区 都 是 71 bp。trnN-GUU 的 长 度 
是 72 bp， 离 JSB、JSA 基因 间隔 区 变化 分 别 为 1 516 一 1 864 bp， 不 超过 以 下 基因 间隔 区 的 
终点 。rps19 基因 在 JSB / IRb 边界 处 由 JSB 向 IRb 延伸 3 bp。ycfl 基因 跨越 JSA / IRa 
4 211 一 4 553 bp 位 于 SSC 区 域内 ， 向 IRb 延伸 1 192~1 540 bp 图 8)。 这 四 个 cp 基因 组 
中 IR / SC 边界 处 的 变异 导致 了 整个 cp 基因 组 序列 长 度 的 差异 ， 并 在 其 他 植物 中 也 已 发 现 

(Yin et al., 2018). 
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基因 用 彩色 框 表示 。 基 因 特 征 上 方 的 数字 表示 基因 末端 与 边界 位 点 之 间 的 距离 。 


Genes are denoted by colored boxes. The numbers above the gene features indicate the distance between the ends 


of genes and the border sites. 
8 天 台 鹅 耳 枯 叶绿体 基因 组 的 仿 -SC 区 的 边界 比较 
Fig. 8 Comparison of IR-SC border positions across chloroplast genomes of Carpinus 


tientaiensis 
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2.7 基于 完整 的 叶绿体 基因 组 序列 的 群体 分 析 

2.7.1 单 倍 型 网 络 构建 

WIRE RHEA cpDNA 分 析 ， 运 用 一 段 遗 传 连锁 的 核酸 序列 (SNP) 的 变异 来 区 分 ， 

构建 单 倍 型 网 络 (haplotype network)。 在 系统 发 育 分 析 时 ， 核 苷 酸 碱 基 一 个 插入 或 缺失 作 
为 一 次 进化 事件 进行 编码 分 析 。 天 台 鹅 耳 杞 单 倍 型 中 的 大 多 数 具 有 居 群 单 倍 型 ， 几 乎 没有 
观察 到 居 群 之 间 的 单 倍 型 共享 。 在 地 理 上 接近 的 天 台 县 (THS) Hl1~H3、 景 宁县 OST) 

H4—H6. EZ: E dii (PDS) H7 一 H9， 各 居 群 内 具有 相同 单 倍 型 ， 而 租 安 县 青 明 尖 
(PQD H10, 2H mkl (PGS) H1 和 青田 县 (PQJ) H12 是 在 单个 标本 中 发 现 的 私 
有 单 倍 型 。 根 据 统计 单 倍 型 网 络 图 〈 图 9)， 揭 示 了 两 组 单 倍 型 ， 在 此 研究 中 称 为 浙 东 组 
THS 居 群 和 浙 西 组 JST 居 群 ， 由 95 个 突变 步 又 隔 开 。 根 据 多 态 位 点 分 析 JST 居 群 和 THS 
居 群 可 变 位 点 和 插入 ， 在 rps16-trnQ 序列 有 三 个 核 昔 酸 取代 分 别 为 T9C CE 275)、 

A 一 G (ME. 299) 和 TG (位 置 1254). 区 分 了 浙 东 组 THS ERE CT. ARI TO. 和 浙 西 组 
JST 居 群 (C、G 和 G)。 从 网 络 图 推测 可 能 的 种 群 历史 ， 除 来 自 THS 居 群 和 JST 居 群 单 倍 
型 之 间 碱 基 突 变 为 95 个 较 远 外 ， 居 群 组 单 倍 型 之 间 演 化 关系 呈现 星 状 中 心 辐射 。THS 居 群 
的 单 倍 型 演化 出 PDS 亚 群 、PQJ 亚 群 和 PGS 亚 群 ， 居 群 组 单 倍 型 之 间 差 异 仅 2 一 6 个 碱 基 
RÆ, THS 居 群 与 PDS 亚 群 单 倍 型 之 间 的 替代 链接 提示 可 能 存在 同 源 性 ; JST 居 群 的 单 倍 
型 演化 出 QYH 亚 型 ，2 个 单 倍 型 之 间 少 量 差 异 〈1 一 2 个 碱 基 突 变 ); Wok G8 HANS 
群 在 历史 上 遇 到 瓶颈 后 曾 发 生 局 部 扩张 。 


网 络 图 中 每 个 


圈 代 表 一 个 单 倍 型 ， 每 个 加 
分 支 上 的 短线 表示 单 倍 型 间 的 碱 基 蔡 换 数 。 


Each circle in the network represents a haplotype, the size of the circle represents the frequency of haplotypes, and 


pan 


pan 
S] 


的 大 小 与 观察 到 的 频率 成 比例 ， 


pan 


圈 颜 色 代表 不 同 的 居 群 ， 


different colors in the circle represent different populations. and short lines on branches represent base 


substitutions between haplotypes. 
图 9 基于 cpDNA 的 天 台 鹅 耳 杞 单 倍 型 网 络 
Fig. 9 Network of haplotypes of Carpinus tientaiensis based on cpDNA 
2.1.2 系统 进化 树 构建 


202205.00144v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


Td 


二 绿 体 基 因 组 包含 丰富 的 系统 发 育 信息 ， 已 被 广泛 用 于 近 缘 种 间 和 种 内 水 平 的 系统 发 
育 重建 。 使 用 叶绿体 基因 组 数据 ， 解 决 了 与 各 种 系统 发 育 困难 群体 相关 的 长 期 争议 。 为 了 
评估 天 台 鹅 耳 杞 系统 发 生 关系 ， 使 用 26 个 天 台 鹅 耳 杞 植株 全 叶绿体 序列 进行 系统 发 育 分 析 。 
通过 极 大 似 然 法 (RAxML) 和 贝 叶 斯 推断 法 (MrBayes) 生成 系统 树 ， 系 统 发 育 分 析 每 个 
节点 数字 为 极 大 似 然 法 (ML) 引导 值 (BS) (%) 和 贝 叶 斯 (BA) 后 验 概率 (PP) C90) 
(Stamatakis, 2014; Xie et al., 2018). 

在 完整 叶绿体 基因 组 序列 中 ， 通 过 系统 分 析 ，6 个 自然 居 群 分 为 THS JE ERI JST 居 群 


(100BS/100PP). THS 居 群 包含 第 一 分 支 THS 10 和 THS 2—3 (65BS/83PP); 第 二 分 支 
PQJ 1 (61BS/60PP), PDS_1 (59BS/73PP), PGS 1 和 PDS 2—3 (70BS/100PP), THS_1 


和 THS 4—9 (70BS/100PP). JST 居 群 第 一 分 文 JST_7 和 JST 9—10 (89BS/100PP); 第 二 
4jX IST 1—6. JST 8 和 QYH. 1 (85BS/100PP) (图 10)。LSC、SSC 数据 集 的 拓扑 结构 
与 物种 叶绿体 基因 组 系统 树 具有 一 致 性 ， 在 种 内 进化 枝 中 仅 发 生 了 细微 的 拓扑 差异 ， 支 持 
形成 单 系 的 群体 。 


A. cpDNA ML 系统 发 育 树 ; B. cpDNA Bayes 系统 发 育 树 。 分 支 数 表示 ML 支持 值 / Bayes 后 验 概 率 。 


A. cpDNA ML tree system development tree; B. cpDNA Bayes tree system development tree. Number of the 

branches indicate ML bootstrap support value/Bayesian posterior probability. 

图 10 基于 完整 叶绿体 基因 组 序列 的 最 大 似 然 和 贝 叶 斯 推理 方法 重建 6 个 分 类 群 的 系统 
发 育 树 


Fig. 10 Phylogenetic tree reconstruction of six taxa using maximum likelihood and Bayesian 


inference methods based on the complete chloroplast genome sequences 
2.7.3 谱系 结构 分 析 

利用 DnaSp 计算 遗传 多 样 性 参数 ， 通 过 AMOVA 分 子 方差 分 析 ， 可 以 评估 谱系 间 的 分 
化 变异 程度 ， 遗 传 分 化 指数 Fu 分 析 可 以 得 到 谱系 间 的 分 化 程度 。 核 昔 酸 取代 和 插入 /缺失 
变异 揭示 了 64 KG SHAB XP 12 个 cpDNA 单 倍 型 (NM) ， 这 些 单 倍 型 中 的 2596 
是 在 单个 植株 中 发 现 的 ， 几 乎 没有 观察 到 居 群 之 间 的 共享 单 倍 型 。 谱 系 间 的 分 化 可 以 通过 


对 单 倍 型 多 样 性 指数 (Ha) 与 核 昔 酸 多 样 性 指数 PO 进行 分 析 ， 其 数值 越 大 ， 说 明 其 遗 
传 多 样 性 越 高 (周文 注 ，2014; Nikulin et al., 2020)。 其 中 PGS 亚 群 、PQJ 亚 群 和 YHS 3 
群 由 单一 植株 组 成 ， 仅 有 私有 单 倍 型 。 居 群 核 苷 酸 多 样 性 指数 (PO, JST 居 群 P; 为 0.000 
01, THS 居 群 已 为 0.000 02, PDS 居 群 P; 73 0.000 03， 所 有 居 群 核 昔 酸 多 样 性 的 变异 均 较 
低 (Pi 二 0.005)。 从 单 倍 型 多 样 性 指数 看 ，JST 居 群 Ha 为 0.6，THS 居 群 现 为 0.5311， IST 
居 群 和 THS 居 群 单 倍 型 多 样 性 相对 较 低 ， 其 中 PDS 亚 群 砚 为 1， 由 于 PDS ERNA 3 bi 
个 体 ， 单 倍 型 多 样 性 偏 高 〈 表 4)。 
表 4 谱系 多 样 性 参数 统计 表 


Table 4 Statistical table of genealogical diversity parameters 


n! 


样本 数 单 倍 型 多 ETE RE 
分 比 单 们 型 PARRER 
、 Number " 分 离 位 点 数目 样 性 性 
居 群 个 数 Number . Average number of 
; of Polymorphic Haplotype E Nucleotide 
Population of haplotypes : nucleotide differences 
samples sites (S) diversity diversity 
(Ns) (K) 
(N) (Ha) (Pj) 
JST 10 3 3 0.6 1.133 0.000 01 
PDS 3 3 6 1 4 0.000 03 
THS 10 3 9 0.511 3.822 0.000 02 


REREH 6 个 居 群 的 分 子 变异 分 析 (AMOVA) 结果 表明 ， 居 和 群 间 的 遗传 分 化 固定 ， 
指数 Fa A 0.970 9， 谱 系 间 分 化 较 大 ， 表 明 在 整个 遗传 变异 中 居 群 间 遗 传 变异 占 97.09%， 
居 群 内 遗传 变异 占 2.91%， 居 群 间 的 遗传 变异 大 于 居 群 内 〈 表 5)。 这 种 分 布 格局 的 主要 原 
因 是 生境 的 片段 化 ， 地 理 隔 离 阻碍 了 居 群 间 的 基因 交流 〈 孙 逸 ，2012; MWÆ, 2015; 
Nikulin et al., 2020). 


A5 谱系 分 子 方差 检验 统计 表 


Table 5 Statistical table of Genealogical molecular variance test 


变异 来 源 自由 度 平方 和 平方 差 百分比 
Source of variation df Sum of squares Variance squares Percentage (96) 
大 群 间 5 662.4 36.807 65 97.09 
Among populations 
居 群 内 
Within populations ay "en Ib ud 
总 计 Total 25 684.5 37.912 65 
同 定 指数 Fixation index (Fa) 0.970 85 


3 讨论 与 结论 

完整 的 叶绿体 基因 组 序列 可 提供 丰富 的 系统 发 育 信息 来 源 ， 天 台 鹅 耳 枯 cpDNA 的 长 
度 平均 为 159 616.2 bp，GC 含量 相似 为 36.41%， 说 明 该 物种 cp 基因 组 的 高 度 保守 性 质 。 
3E LA) EI TECK G6 ELI cp DNA 中 发 现 LTR 重复 序列 包括 正 向 重复 平均 为 32 个 ， 回 文 
重复 为 25 个 ， 反 转 重 复 为 22 个 ; SSR 重复 序列 不 同类 型 为 87 个 。 这 些 重 复 中 的 大 多 数位 
于 和 蛋白 编码 区 、 非 编码 区 和 tRNA 中 。 在 藻类 和 被 子 植物 基因 组 中 LTR 重复 序列 很 常见 ， 


Iz] 


mn 


limi 
um 


是 促进 cp 基因 组 重 排 的 主要 因素 之 一 ， 并 且 许 多 重 排 终 点 都 与 此 类 重复 序列 相关 
(Pombert et al, 2005; Zhang et al, 2020)。 在 所 有 个 体 中 ，SSR 通常 由 AT ERAR, H 
中 单 核 昔 酸 由 A/T 碱 基 组 成 占 92%， 大 多 数 蛋 白质 编码 基因 都 具有 高 度 的 密码 子 偏好 性 ， 
在 优选 的 密码 子 中 ，63.49% 表 现 出 较 高 的 偏好 ， 叶 绿 体 密 码 子 的 第 三 个 AIT 偏好 较 高 。 相 
关 研 究 表明 基因 组 AT 含量 与 重复 序列 的 动力 学 以 及 叶绿体 蛋白 编码 基因 的 密码 子 偏向 性 
有 关 (Yu et al., 2019; Wu et al., 2020). 
叶绿体 基因 组 SNP 的 数量 及 碱 基 蔡 换 为 物种 之 间 的 系统 发 育 解析 提供 了 有 益 的 标记 
(XÆ, 2015; Nikulin et al., 2020)。 根 据 溯 祖 理 论 ， 通 过 单 倍 型 网 络 图 ， 结 合 地 理 信息 我 
们 可 以 推断 种 群 的 起 源 、 扩 散 历史 (Huang et al., 2014)。 通 过 对 SNP 多 态 位 点 和 核 背 酸 变 
异 分 析 ， 单 核 苷 酸 取代 显示 天 台 忽 耳 杖 分 为 天 台 县 居 群 CTHSO 和 景 宁 县 居 群 (JST)， 亚 
群 间距 离 相 近 的 优先 聚 为 一 支 。 除 来 自 THS 居 群 和 IST 居 群 单 倍 型 关系 较 远 外 ， 居 群 组 大 
- 部 分 单 倍 型 之 间 仅 有 2 一 6 个 碱 基 突变 ， 某 几 个 同一 或 者 相近 地 理 居 群 的 单 倍 型 具有 聚 类 现 
> 象 ， 这 可 能 由 于 该 物种 对 亚热带 湿润 气候 或 暖 温带 气候 的 环境 要 求 较 高 造成 ( 陈 之 端 
1994)。 天 人 台 鹅 耳 术 具有 居 群 组 单 倍 型 ， 没 有 居 群 之 间 的 单 倍 型 共享 ， 这 种 单 系 进 化 枝 可 能 
是 由 于 地 理 隔离 导致 短 时 期 内 居 群 之 间 基 因 交 流 较 少 造 成 的 Nikulin et al., 2020)。 所 有 居 
群 核 音 酸 多 样 性 的 变异 均 较 低 (Pi 二 0.005)，JST 居 群 和 THS 居 群 单 倍 型 多 样 性 较 低 (4 
为 0.5 一 0.6)， 意 味 着 最 近 发 生 过 居 群 的 瓶颈 效应 〈 孙 逸 ，2012; Jioc. 20140. FTH 
第 三 纪 及 第 四 纪 的 气候 动荡 及 冰期 更 兰 ， 天 台 鹅 耳 枯 退缩 到 狭小 区 域 的 避难 所 ， 度 过 冰期 ; 
或 群体 局 部 扩张 到 湿润 地 区 的 森林 中 〔 陈 之 端 ，1994; Qi etal., 2012)。 
之 通过 对 天 台 鹅 耳 杨 谱系 结构 与 分 化 的 研究 ， 对 遗传 多 样 性 比较 高 的 居 群 制定 资源 保存 
> 和 引种 驯化 策略 。 在 6 个 自然 居 群 中 都 检测 到 了 独特 的 单 倍 型 ， 尤 其 THS 居 群 、JST 居 群 
C 和 PDS 亚 群 具有 较 高 的 单 倍 型 多 样 性 ， 栖 息 地 面积 较 大 内 部 环境 较 稳 定 ， 需 要 加 强 栖息 地 
保护 ， 以 维持 天 台 鹅 耳 林 高 的 遗传 多 样 性 。 天 台 笋 耳 杞 居 群 规模 较 小 、 隔 离 程度 较 高 ， 居 
群 间 呈现 较 大 的 遗传 分 化 ， 致 使 种 源 不 断 减少 ， 是 急需 保护 的 濒危 植物 。 对 繁殖 衰退 的 居 
群 应 开展 遗传 拯救 ， 引 入 以 花粉 为 主导 基因 流 实验 ， 移 入 新 个 体 或 基因 型 而 减 绥 遗传 侵蚀 
进而 提高 天 台 鹅 耳 杨 种 群生 存 力 。 
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